home *** CD-ROM | disk | FTP | other *** search
/ SGI Freeware 2002 November / SGI Freeware 2002 November - Disc 2.iso / dist / fw_glimpse.idb / usr / freeware / src / glimpse-3.0 / README.z / README
Text File  |  1997-09-09  |  6KB  |  133 lines

  1. GLIMPSE 3.0: searching entire file systems
  2.  
  3. Glimpse version 3.0 improves the original version in many ways.  The
  4. main changes are listed below.  Glimpse is a very powerful indexing and
  5. query system that allows you to search through all your files very
  6. quickly.  It can be used by individuals for their personal file systems
  7. as well as by organizations for large data collections.  Glimpse is the
  8. default search engine in Harvest (see below).
  9.  
  10. Glimpseindex, which you run by saying "glimpseindex DIR" builds an
  11. index of all text files in the tree rooted at DIR.  
  12. (e.g., glimpseindex ~ indexes all your files.) With it, glimpse can
  13. search through all files much the same way as agrep (or any other
  14. grep), except that you don't have to specify file names and the search
  15. is fast.  For example,
  16.  
  17.     glimpse -1 unbelievable
  18.  
  19. will find all occurrences (in all your files!) of "unbelievable" 
  20. allowing one spelling error;
  21.  
  22.     glimpse -F mail arizona 
  23.  
  24. will find all occurrences of "arizona" in all files with "mail" somewhere
  25. in their name;
  26.  
  27.     glimpse  'Arizona desert;windsurfing' 
  28.  
  29. will find all lines that contain both "Arizona desert" and "windsurfing".
  30.  
  31. Glimpse supports three types of indexes: a tiny one (2-3% of the
  32. size of all files), a small one (7-9%), and a medium one (20-30%).
  33. The larger the index the faster the search.
  34. Glimpse supports most of agrep's options (agrep is our powerful version
  35. of grep, and it is part of glimpse) including approximate matching
  36. (e.g., finding misspelled words), Boolean queries, and even some
  37. limited forms of regular expressions.
  38.  
  39. The WWW home page for glimpse is in
  40.     http://glimpse.cs.arizona.edu:1994/
  41.  
  42. HTML version of glimpse manual pages is in
  43.     http://glimpse.cs.arizona.edu:1994/glimpsehelp.html
  44. HTML version of glimpseindex manual pages is in
  45.     http://glimpse.cs.arizona.edu:1994/glimpseindexhelp.html
  46. HTML version of glimpseserver manual pages is in
  47.     http://glimpse.cs.arizona.edu:1994/glimpseserverhelp.html
  48.  
  49. The complete source code for glimpse and glimpseindex, as well
  50. as manual pages and other stuff can be obtained from
  51.     ftp://cs.arizona.edu/glimpse/glimpse-3.0.src.tar.Z
  52. Sparc SunOS 4.1.1 executables are in
  53.     ftp://cs.arizona.edu/glimpse/glimpse-3.0.bin.sunos.4.1.1.tar.Z 
  54. Sparc SunOS 4.1.3 executables are in
  55.     ftp://cs.arizona.edu/glimpse/glimpse-3.0.bin.sunos.4.1.3.tar.Z 
  56. Solaris executables are in
  57.     ftp://cs.arizona.edu/glimpse/glimpse-3.0.bin.solaris.tar.Z 
  58. Dec Alpha OSF/1 executables are in
  59.     ftp://cs.arizona.edu/glimpse/glimpse-3.0.bin.alpha.tar.Z
  60.  
  61. There are also binaries for AIX, SGI, Linux, and HP.  
  62. (We thank Heinrich Stamerjohanns, Chris Dalton, cmelikian@VNET.IBM.COM,
  63. Jim Hurley, and Piroz Mohseni for those.) 
  64. More binaries will be posted as they become available.
  65.  
  66. An article describing the ideas behind the design of glimpse is in
  67. ftp://cs.arizona.edu/glimpse/glimpse.ps.Z
  68.  
  69. GlimpseHTTP home page is in
  70.     http://glimpse.cs.arizona.edu:1994/ghttp/
  71. (GlimpseHTTP is a Glimpse add-on tool to provide full-text
  72. search for your WWW server)
  73.  
  74. Harvest's WWW home page is
  75.     http://harvest.cs.colorado.edu/
  76. (Harvest is an integrated set of tools to gather, extract,
  77. organize, search, cache, and replicate relevant information
  78. across the Internet.) 
  79.  
  80. Mail glimpse-request@cs.arizona.edu to be added to the glimpse mailing list.
  81. Mail glimpse@cs.arizona.edu to report bugs, ask questions, discuss
  82. tricks for using glimpse, etc.  (This is a moderated mailing list.)
  83.  
  84. Udi Manber, Burra Gopal, and Sun Wu.
  85.  
  86. Main changes and additions in version 3.0:
  87.  
  88. 2.1 ---> 3.0
  89.  
  90. - added a data structure (in .glimpse_turbo) that speeds up queries
  91.   using -w and -i considerably for large indexes.  It is meant mostly for
  92.   servers using glimpse (e.g., Harvest and glimpseHTTP servers),
  93.   but it benefits everyone.  With this "turbo" option, typical queries
  94.   take less than a second even for very large indexes.
  95.   This was so successful that we made it the default rather than an
  96.   option (it used to be -T in some earlier versions).
  97.   If the .glimpse_turbo file is deleted, glimpse will still work properly
  98.   (but glimpseindex -f and -a require it).
  99. - incremental indexing is now fully supported (even for -b).  Deletion
  100.   from the index is supported.  glimpseindex -d filename(s) completely
  101.   deletes the files from the index;  glimpseindex -D filename(s) deletes
  102.   the files only from the file list.
  103. - the index has been improved in several ways (transparently except for
  104.   speed and space).  As a result, indices built with earlier versions of
  105.   glimpseindex will not work with 3.0 -- you must reindex again. 
  106. - several options were added to glimpseindex and glimpse:
  107.   glimpseindex -E indexes all file without attempting to run the filetype
  108.   filtering (but excluded files or suffixes still apply).
  109.   glimpse -Q extends -N in a nice way giving much more information about
  110.   the matches in the index.
  111.   glimpse -L has more options:  -L x | x:y | x:y:z
  112.   if one number is given, it is a limit on the total number of matches.
  113.   Glimpse outputs only the first x matches.
  114.   If two numbers are given (x:y), then y is an added limit on the total
  115.   number of files.
  116.   If three numbers are given (x:y:z), then z is an added limit on the
  117.   number of matches per file.
  118.   If any of the x, y, or z is set to 0, it means to ignore it
  119.   (in other words 0 = infinity in this case);  for example,
  120.   -L 0:10 will output all matches to the first 10 files that
  121.   contain a match.
  122.   (There are also some undocumented-as-yet options. We are running out
  123.   of letters.  Only -j and -Y are not used!)
  124. - glimpse 3.0 still has a LOT of makefiles (one per architecture / OS). 
  125.   We hope to include autoconf support for glimpse in the future: 
  126.   but these should be sufficient for most purposes.
  127. - several bugs were fixed, and the whole package is now more portable.
  128.   Binaries and make files for the following platforms are now available:
  129.   AIX-3.2.5, HPPA, HPMC68K, IBM-RS6000, Linux, SGI. (Binaries and make
  130.   files for SUNOS4.1.1, SUNOS4.1.3, SOLARIS 5.3 and DEC OSF/1 (ALPHA)
  131.   are avaialable as usual.) See README.install for more details.
  132.  
  133.